Alteryx DesignerでGoogle BigQueryのデータを読み込む
こんにちは。
データアナリティクス事業本部ソリューション部のshoです。
セルフサービス分析ツールであるAlteryx Designerでは、ファイルだけでなく、データベースからもデータを読み込み、書き込みをすることが可能です。
今回は、BigQueryのデータを読み込む方法についてご紹介していきたいと思います。
BigQueryからデータを読み込む方法は2種類あります。
- データ入力ツールからODBC接続を使用する
- Alteryx Galleryに公開されているGoogle BigQuery入力ツールを使用する
ここからは、各種手順についてみていきたいと思います。
BigQueryのデータをAlteryx Designerで読み込もう
データ入力ツールからODBC接続を使用する
データ入出力カテゴリにあるデータ入力ツールは、ファイルやデータベースからデータを抽出することが可能です。
データ入力ツールをキャンバスに配置し、設定ウィンドウの“ファイルまたはデータベースを接続”より、データソースタブを選択します。
データソースの一覧より、汎用接続の“ODBC接続”をクリックします。
ODBC接続の一覧より、BigQueryに接続可能なデータソースを選択し、“OK”をクリックします。
※BigQueryのODBCドライバーをインストールし、ODBCデータソースアドミニストレーターにて、接続情報を保存しておく必要があります。
対象のデータベースへの接続が成功すると、テーブル、クエリのエディタ画面が起動します。
ビジュアルクエリビルダなどを使用して、抽出する対象のテーブル、および項目を指定し、“OK”をクリックします。
これにて設定が完了しました。
ODBC接続にてデータを抽出したけれど、文字化けが発生している場合の対処方法
データベースから取り込んだデータを確認した際、日本語のデータ項目が文字化けする可能性があります。
メタデータを確認すると、【V_String】になっており日本語を取り込むことができない状況になっていることが起因しています。
その場合は、その対象の項目にConvertFromCodePage関数を使用することで文字化けが解消します。
複数フィールドフォーミュラツールを使用すると複数のデータ項目を一括で変換できるので便利です。
- 対象のデータ項目を指定
- 出力タイプを変更を有効化し、データ型は【V_WString】を指定
- 式を設定【ConvertFromCodePage([_CurrentField_], 932)】
これで文字化けは解消します。
Google BigQuery入力ツールを使用する
Alteryx GalleryからダウンロードしたGoogle BigQuery入力ツールは、BigQueryからデータを抽出する際に使用する専用のコネクターになります。
インストール後、コネクタカテゴリにあるGoogle BigQuery入力ツールをキャンバスに配置します。
設定ウィンドウにてまずは、認証モードを指定します。
認証モードは以下の2種類のいずれかを使用します。
- サービス間:Googleサービスアカウントファイルをダウンロードし、適用するパターン
- エンドユーザー:クライアントID・クライアントシークレットを入力するパターン
認証モードの設定が完了後、まずは対象のプロジェクトを選択します。
今回は、カスタムクエリを使用してデータを抽出するため“カスタムクエリを使用”にチェックを入れます。
選択後、BigQueryテーブル入力設定が可能となるため、クエリするプロジェクトを選択し、クエリを入力します。
その他、データ項目の最大フィールド長やワークフローでデータを抽出する前後に実施したいクエリがある場合は、設定が可能です。
これにて設定は完了となります。
まとめ
今回は、BigQueryのデータをAlteryx Designerで読み込む方法についてご紹介しました。
Google BigQueryのデータをAlteryx Designerで分析したい際のお役に立てれば嬉しいです。